噪声的去除或取消对成像和声学具有广泛的应用。在日常生活中,Denoising甚至可能包括对地面真理不忠的生成方面。但是,对于科学应用,denoing必须准确地重现地面真相。在这里,我们展示了如何通过深层卷积神经网络来定位数据,从而以定量精度出现弱信号。特别是,我们研究了晶体材料的X射线衍射。我们证明,弱信号是由电荷排序引起的,在嘈杂的数据中微不足道的信号,在DeNo的数据中变得可见和准确。通过对深度神经网络的监督培训,具有成对的低噪声数据,可以通过监督培训来实现这一成功。这样,神经网络就可以了解噪声的统计特性。我们证明,使用人造噪声(例如泊松和高斯)不会产生这种定量准确的结果。因此,我们的方法说明了一种实用的噪声过滤策略,可以应用于具有挑战性的获取问题。
translated by 谷歌翻译
Heating in private households is a major contributor to the emissions generated today. Heat pumps are a promising alternative for heat generation and are a key technology in achieving our goals of the German energy transformation and to become less dependent on fossil fuels. Today, the majority of heat pumps in the field are controlled by a simple heating curve, which is a naive mapping of the current outdoor temperature to a control action. A more advanced control approach is model predictive control (MPC) which was applied in multiple research works to heat pump control. However, MPC is heavily dependent on the building model, which has several disadvantages. Motivated by this and by recent breakthroughs in the field, this work applies deep reinforcement learning (DRL) to heat pump control in a simulated environment. Through a comparison to MPC, it could be shown that it is possible to apply DRL in a model-free manner to achieve MPC-like performance. This work extends other works which have already applied DRL to building heating operation by performing an in-depth analysis of the learned control strategies and by giving a detailed comparison of the two state-of-the-art control methods.
translated by 谷歌翻译
在这项工作中,我们考虑了需要通过电缆或机器人臂操纵/运输物体的移动机器人的问题。我们考虑一种操纵机器人的数量冗余的场景,即,可以通过机器人的不同配置获得所需的对象配置。这项工作的目的是表明,可以使用通信来实现机器人中的协同局部反馈控制器,以改善扰动抑制并降低对象中的结构应力。特别地,我们考虑采样测量并通过无线传输测量的现实场景,并且采样周期与系统动态时间常数相当。我们首先提出了一种运动模型,该模型与高增益控制下的整体系统动态一致,然后我们为不同规范下的配置误差提供了足够的指数稳定性和单调减少。最后,我们在完整的动态系统上测试所提出的控制器,显示出局部通信的益处。
translated by 谷歌翻译
在本文中,我们为采样通信场景中的一类多机器人系统提出了一种反向运动控制器。目标是使一组机器人执行轨迹跟踪{以协调的方式}当通信的采样时间是不可忽略的,破坏标准控制设计的理论收敛保证。鉴于配置空间中可行的期望轨迹,所提出的控制器从采样时间瞬间从系统接收测量,并计算由低级控制器跟踪的机器人的速度引用。我们提出了一个共同设计的反馈加上馈电控制器,具有可提供的稳定性和误差会聚保证,并进一步表明所获得的控制器是可分散的实现的可供选择。我们使用现实模拟器(飞行起重机)的电缆悬挂负荷的协同空中操纵方案中的数值模拟来测试所提出的控制策略。最后,我们将建议的分散控制器与集中式方法进行比较,可通过智能启发式调整反馈增益,并表明它实现了可比性。
translated by 谷歌翻译
在本文中,我们提出了一种基于模型的增强学习(MBRL)算法,称为\ emph {Monte Carlo概率的学习控制}(MC-PILCO)。该算法依赖于高斯流程(GPS)来对系统动力学进行建模以及蒙特卡洛方法以估计策略梯度。这定义了一个框架,在该框架中,我们可以在其中选择以下组件的选择:(i)成本函数的选择,(ii)使用辍学的策略优化,(iii)通过在使用中的结构内核来提高数据效率GP型号。上述方面的组合会极大地影响MC-PILCO的性能。在模拟卡车杆环境中的数值比较表明,MC-PILCO具有更好的数据效率和控制性能W.R.T.最先进的基于GP的MBRL算法。最后,我们将MC-PILCO应用于实际系统,考虑到具有部分可测量状态的特定系统。我们讨论了在策略优化过程中同时建模测量系统和国家估计器的重要性。已在模拟和两个真实系统(Furuta pendulum和一个球形式钻机)中测试了所提出的溶液的有效性。
translated by 谷歌翻译
我们提出了一个基于预测校正范式的统一框架,用于在原始和双空间中的预测校正范式。在此框架中,以固定的间隔进行了连续变化的优化问题,并且每个问题都通过原始或双重校正步骤近似解决。通过预测步骤的输出,该解决方案方法是温暖启动的,该步骤的输出可以使用过去的信息解决未来问题的近似。在不同的假设集中研究并比较了预测方法。该框架涵盖的算法的示例是梯度方法的时变版本,分裂方法和著名的乘数交替方向方法(ADMM)。
translated by 谷歌翻译